1
Dalla Probabilità alla Verosimiglianza: La Scienza dell'Inferenza
MATH003Lesson 6
00:00
L'inferenza statistica segna il passaggio dal predire risultati basati su parametri noti (probabilità) al determinare quali parametri siano più coerenti con i dati osservati (verosimiglianza). Mentre una funzione di densità di probabilità $f(x|\theta)$ descrive la distribuzione dei dati $x$ per un $\theta$ fisso, la funzione di verosimiglianza $L(\theta|x)$ tratta i dati osservati come fissi e fa variare il parametro $\theta$ per quantificare il supporto relativo a diverse ipotesi.

Il Principio dell'Inversione

La funzione di verosimiglianza è spesso espressa nella forma della densità congiunta. Per una distribuzione Normale con varianza fissa, la verosimiglianza è definita da:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

Qui valutiamo la "plausibilità" di diversi valori di $\theta$ dati la media campionaria $\bar{x}$. Per trovare il picco di questa plausibilità, utilizziamo Definizione 6.2.2: la verosimiglianza logaritmica $l(\theta | s) = \ln L(\theta | s)$. Questa trasformazione semplifica prodotti di osservazioni indipendenti in somme, rendendo massimizzare modelli complessi computazionalmente fattibile.

Esempio Risolto: L'Indagine Sulla Statura (ESEMPIO 6.3.5)

I Dati

Consideriamo un campione di $n=30$ altezze con una deviazione standard calcolata di $s=2.379$. Utilizzando il modello Normale con localizzazione e scala, cerchiamo di stimare la media vera $\theta$.

Inferenza e Precisione

L'errore standard è calcolato come $s/\sqrt{30} = 0.43434$. Questo valore misura la "affilatura" del nostro picco di verosimiglianza. Un errore standard più piccolo implica un picco più stretto e affilato, che rappresenta una maggiore precisione nelle nostre inferenze riguardo a $\theta$.

Dimensionalità e Vincoli

In scenari complessi come ESEMPIO 6.1.5 (Modelli Multinomiali), dobbiamo tenere conto delle dipendenze logiche. Come notato: "Osserva che è davvero solo bidimensionale, perché non appena conosciamo il valore di due qualsiasi dei $\theta_i$... immediatamente conosciamo il valore del parametro rimanente." Questo vincolo è fondamentale per definire correttamente lo spazio dei parametri $\Omega$.

Fondamenti Asintotici

Il ponte tra verosimiglianza e inferenza si basa sul Teorema del Limite Centrale. Man mano che $n \to \infty$, la distribuzione dei nostri stimatori converge. Specificamente, nell' ESEMPIO 6.5.4 Modello Bernoulliano:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

Questo ci permette di quantificare l'incertezza usando intervalli z e valori p, purché disponiamo di campioni sufficientemente grandi.

🎯 Principio Fondamentale
I metodi di inferenza statistica senza distribuzione richiedono solo assunzioni minime sulla distribuzione campionaria, rendendoli robusti quando la famiglia $\{P_{\theta} : \theta \in \Omega\}$ è molto ampia. Al contrario, i metodi parametrici di verosimiglianza si basano sulla curvatura della verosimiglianza logaritmica, dove l'Informazione di Fisher $nI(\theta)$ determina la varianza della nostra funzione di punteggio.